Google TPU v7 Ironwood
Google 第七代 TPU,代号 Ironwood,2025-04 Google Cloud Next 发布、2025-H2 GA,是首款专为"推理时代"设计的 TPU(强调推理吞吐 / 长上下文),是 Google AI 路线图对 NVIDIA Blackwell 时代的回应。
关键规格
| 维度 | 数值 |
|---|---|
| 发布 | 2025-04 公布(Google Cloud Next 2025)/ 2025-H2 GA |
| 制程 | TSMC 3nm(推测) |
| FP8 算力 | ~4,614 TFLOPS(单芯片,行业推算) |
| 显存 | 192 GB HBM3E |
| 显存带宽 | ~7.4 TB/s |
| 互联 | ICI 升级(更大 Pod 规模) |
| 整机形态 | TPU v7 Pod(9,216 颗,单 Pod 规模显著大于前代) |
[!info] GA 时点口径说明(2026-05-29 核) 规格(192GB HBM3E / ~7.37 TB/s / 4,614 TFLOPS FP8 / 9,216 颗超级 Pod / 2025-04 Google Cloud Next 公布)经 Google 官方博客逐项核对吻合。GA 时点:Google 官方 2025-11 博客称"未来几周内(coming weeks)正式 GA",即实际 GA 落在 2025 年末,仍在"2025-H2"区间但偏晚(Google Cloud Blog 2025-11,T1)。
市场定位
Ironwood 关键定位:
- 首款 "推理优先" TPU —— 对应 AI 进入推理时代(Inference-time compute scaling)的趋势
- 单芯片 FP8 算力比 Trillium 跳跃式提升(~5×)
- HBM3E 192GB → 长上下文 / 大批量推理优势
- 大 Pod 规模(9,216 颗)→ 多模型并行推理友好
客户与部署
- Google DeepMind:Gemini 2.5+ 模型推理核心算力
- GCP 外部 —— 2025-H2 上线 Cloud TPU v7 实例
- 路线图客户 —— 与 NVIDIA B200/B300 / AWS Trainium 2 形成"超大规模云三足鼎立"格局
演进路线
Google TPU v6 Trillium(2024)→ TPU v7 Ironwood(2025)→ TPU v8(路线图)
关键来源
- 2-01-核心逻辑芯片 —— Google TPU 路线图、CSP 自研 AI 芯片市场
关联
↑ up::2-01-核心逻辑芯片 Broadcom HBM3E ↓ down::3-01-云计算与智算平台 Google Gemini ⚔ competitor::NVIDIA B200 NVIDIA B300 AWS Trainium 2 ∈ belongs_to::2-01-核心逻辑芯片